2.7 连接有限总体和超总体的因果推断

我们一直在关注随机化实验中的有限总体视角, 我们把所有潜在输出看作固定的数目. 即使潜在结果是随机变量, 我们也可以在有限视角下, 对它们取条件概率. 这样的好处是, 它关注实验设计, 对结果的生成过程有最小的额外假设. 但是, 它也被批评只有内部有效性, 但没有外部有效性.

内部有效性 外部有效性

  • 内部有效性: 统计分析对手上的样本有效.
  • 外部有效性: 统计分析对一个更广阔的群体有效.

目前所有的统计特性都是基于条件概率得到的, 那我们如何推广到一个更大的群体呢?
对于一些统计学家, 这只是一个技术问题. 我们可以改变统计框架, 假设这些单位是从一个更大的超总体抽样得到的. 这是一个方便的框架, 尽管它没有真正解决上面的问题.

1 CRE

假设 {Zi,Yi(1),Yi(0),Xi}i=1ni.i.d{Z,Y(1),Y(0),X} 来自一个超总体. 则我们可以去掉下标 i. 稍微滥用一下记号, 定义总体平均因果效应为 τ=E[Y(1)Y(0)]=E[Y(1)]E[Y(0)]. 在超总体的框架下, 我们可以得到 CRE

超总体的 CRE

我们有 Z{Y(1),Y(0),X}.

此时[1] τ=E[Y(1)|Z=1]E[Y(0)|Z=0](1.1)=E(Y|Z=1)E(Y|Z=0).
这里 τ 可以直接由观测结果表示, 因此它是非参数可识别[2].

(1.1) 立即推出, 我们有一个矩估计量 τ^. 在 Z 条件下, 这就是一个标准的双样本检测问题. 我们有E(τ^|Z)=τ,Var(τ^|Z)=Var{Y(1)}n1+Var{Y(0)}n0.
在 IID 采样下, 样本方差是无偏的, 所以 Neyman 的方差估计量对于 Var(τ^|Z) 是无偏的. 因此就没有保守性的问题了.

我们还可以讨论协变量调整. 基于 OLS: Y(1)=γ1+β1TX+ε(1),Y(0)=γ0+β0TX+ε(0). 我们有 τ=E[Y(1)Y(0)]=γ1γ0+(β1β0)TE(X), 因为 ε(1),ε(0) 均值为 0. 如果采样的版本记为 γ^1,β^1;γ^0,β^0, 则 τ 的协变量调整为 τ^adj=γ^1γ^0+(β^1β^0)TX. 如果 X=0, 这退化为 Lin 的估计量 ( (2.1)) τ^L=γ^1γ^0.
不过 EHW 方差估计量没法对 τ^L 适用, 因为在超总体采样的时候会有额外的不确定性. 我们可以进行如下修正: (β^1β^0)TSX2(β^1β^0)n.

2 扩展到 SRE

依然假设 {Zi,Yi(1),Yi(0),Xi}i=1ni.i.d{Z,Y(1),Y(0),X}. 假设协变量离散 Xi{1,,K}.

超总体下的 SRE

我们有 Z{Y(1),Y(0)}|X.

此时τ[k]=E[Y(1)Y(0)|X=k]=E(Y|Z=1,X=k)E(Y|Z=0,X=k), 从而 τ=E[Y(1)Y(0)]=k=1KP(X=k)E[Y(1)Y(0)|X=k]=k=1KP(X=k)τ[k].


  1. 这里的第二个等式只是因为给定 Z=1 后得到的 Y(1) 就是 Y. ↩︎

  2. 它的计算仅靠观测结果就可以计算, 且不依赖具体的分布、参数. ↩︎